library(plotly)1 Análisis univariado
1.1 Variables cualitativas
1.1.1 Variables relacionadas con la información personal
Se puede observar que en el periodo en el que fue realizada la prueba, había una notoria diferencia en cuanto a la distribución de géneros, ya que hay una mayor cantidad de mujeres, y no una distribución 50/50, que sería lo esperado en este tipo de pruebas.
Se evidencia una clara mayoría en cuanto a estudiantes sin etnia, sin embargo hay una porción aceptable de estudiantes con esta característica.
El estado civil de la mayoría de estudiantes que presentaron la prueba es soltero, aunque hay una buena porción de estudiantes cuyo estado civil es casado y otros cuyo estado civil es unión libre.
Todas las categorías tienen un número notable de individuos. Se destaca la secundaria completa y la primaria incompleta como los niveles educativos más comunes en los padres de los estudiantes que realizaron la prueba en este periodo, aunque también destaca una cantidad considerable de padres con educación profesional completa.
Como en el caso anterior, el nivel de educación más común es la secundaria completa, aunque en este caso, una buena cantidad de madres tienen como nivel educativo un técnico o tecnológico completo.
Se observa un grupo significativo de padres cuya ocupación es trabajar por cuenta propia, concretamente, un 30.82% de los padres están en esta categoría. De ahí, las demás categorías no resultan muy destacables.
En el caso de las madres, resalta el hecho de que casi el 40% trabajan como amas de casa o realizando tareas en el hogar.
Se observa que un grupo grande de estudiantes trabaja menos de 10 horas. También resalta el hecho de que hay una cantidad considerable de estudiantes que no respondieron a esta pregunta en el cuestionario, por lo que entran en la categoría desconocido.
1.1.2 Variables relacionadas con la información académica
Hay una clara mayoría de estudiantes que repasaron por cuenta propia, seguido de una cantidad considerable de estudiantes que no se prepararon de ninguna manera.
Se espera que la mayoría de estudiantes estén cursando semestres avanzandos como séptimo u octavo, sin embargo hay algunos estudiantes que cursan primeros semestres, lo que resulta interesante ya que se supone que se necesita un avance del 75% en el programa académico que se esté cursando para presentar esta prueba.
Resalta la cantidad de estudiantes cuyo grupo de referencia es ingeniería y administración y afines, aunque no es raro debido a la cantidad de ingenierías diferentes que se ofertan en las universidades de todo el país.
La gran mayoría de estudiantes están en un programa cuya modalidad es presencial, siendo este un 81.5% de todos los estudiantes de la base de datos.
De la misma manera que con la modalidad del programa, la mayoría de estudiantes estudian en una universidad. Por otra parte hay una pequeña porción de estudiantes que estudian en una institución tecnológica.
1.1.3 Variables relacionadas con la información socioeconómica
1.2 Variables cuantitativas
El histograma muestra una distribución muy parecida a la normal, resaltando que hay muy pocas pero existentes puntuaciones con puntaje o bien perfecto, o bien con ninguna respuesta correcta.
De la misma manera que con razonamiento cuantitativo, el histograma resulta casi simétrico con algunos datos atípicos representando los peores puntajes y los mejores, siendo estos, de nuevo, el mínimo puntaje posible y el puntaje perfecto en esta área, respectivamente.
Es muy parecido a los componentes anteriores, aunque resalta una barra en los puntajes más bajos, que aunque pequeña, se puede observar en el gráfico, dando a entender que en este componente hay una cantidad visible de puntajes que rondan de 0 a 20 puntos.
El histograma ya no presenta una simetria tan marcada, y resaltan las barras más alejadas de la media, puesto que son visibles, mostrando que hay una cantidad visible de personas tanto con puntajes mínimos como con puntajes perfectos.
El histograma resalta respecto a las otras variables debido a un mayor número de puntajes por debajo de 150, que se espera sería la media. Además resalta que hay una cantidad considerable de personas con el puntaje más bajo. En el boxplot también se puede apreciar como en este caso, la mediana no está tan cerca a 150, que sería lo esperado.
La distribución de los puntajes totales, en este caso, también parece asemejarse a una curva normal, lo cual tiene sentido debido al como se diseñan estas pruebas, intentando que tengan una distribución normal con una media teórica de 150 y una desviación estándar de 30 puntos. Cabe resaltar que el mayor puntaje de esta prueba fue 278, mientras que el menor fue 0.